本文提出了一个程序性内容发生器,该发生器根据新颖性的开放式和内在的定义来发展Minecraft建筑物。为了实现这一目标,我们使用3D自动编码器评估了个体在潜在空间中的新颖性,并在勘探和转型阶段之间进行了交替。在探索过程中,系统通过在潜在空间(由当前自动编码器定义)中的CPPN - 纳特搜索和约束新颖性搜索进化了CPPN的多个种群。我们应用一组维修和约束功能,以确保候选人在进化过程中遵守基本的结构规则和约束。在转换过程中,我们通过使用新颖的内容来重新验证自动编码器,重塑潜在空间的边界,以识别解决方案空间的新有趣区域。在这项研究中,我们评估了在转型过程中训练自动编码器的五种不同方法及其对人群进化过程中人群质量和多样性的影响。我们的结果表明,与静态模型相比,通过重新训练自动编码器,我们可以实现更好的开放式复杂性,当使用具有多种复杂性的个体的较大数据集进行重新训练时,该模型可以进一步改进。
translated by 谷歌翻译
本文通过将影响建模的任务视为强化学习(RL)过程,引入了范式转变。根据拟议的范式,RL代理通过尝试通过其环境(即背景)来最大化一组奖励(即行为和情感模式)来学习政策(即情感互动)。我们的假设是,RL是交织的有效范式影响引起和与行为和情感示威的表现。重要的是,我们对达马西奥的躯体标记假设的第二个假设建设是,情绪可以成为决策的促进者。我们通过训练Go-Blend Agents来对人类的唤醒和行为进行模型来检验赛车游戏中的假设; Go-Blend是Go-explore算法的修改版本,该版本最近在硬探索任务中展示了最高性能。我们首先改变了基于唤醒的奖励功能,并观察可以根据指定的奖励有效地显示情感和行为模式调色板的代理。然后,我们使用基于唤醒的状态选择机制来偏向Go-Blend探索的策略。我们的发现表明,Go-Blend不仅是有效的影响建模范式,而且更重要的是,情感驱动的RL改善了探索并产生更高的性能剂,从而验证了Damasio在游戏领域中的假设。
translated by 谷歌翻译
传统上,将情感建模视为映射可测量的影响表现的过程,这些过程来自用户输入的多种方式,以影响标签。该映射通常是通过机器学习过程来推断的。如果相反,一个人训练一般的主题不变表示,考虑影响信息,然后使用此类表示形式来建模?在本文中,我们假设影响标签构成了情感表示形式的组成部分,而不仅仅是训练信号,我们探讨了如何采用对比度学习的最新范式来发现目的的一般高级感动式的表示形式建模影响。我们介绍了三种不同的监督对比学习方法,用于考虑影响信息的培训表示。在这项最初的研究中,我们根据来自多种模式的用户信息来测试Recola数据集中唤醒预测的建议方法。结果证明了对比度学习的表示能力及其在提高情感模型准确性方面的效率。除了与端到端的唤醒分类相比,其证据更高的性能之外,最终的表示是通用和主题不合时式的,因为训练受到了任何多模式语料库可用的一般影响信息的指导。
translated by 谷歌翻译
对于任何游戏人工智能任务,包括游戏玩法,测试,玩家建模和程序内容生成,访问准确的游戏状态信息至关重要。自我监督的学习(SSL)技术已证明能够从游戏的高维像素输入到压缩潜在表示中从高维的像素输入中推断出准确的游戏状态信息。对比度学习是SSL的流行范式之一,其中对游戏图像的视觉理解来自与简单图像增强方法定义的不同和类似的游戏状态。在这项研究中,我们介绍了一种新的游戏场景增强技术(名为GameClr),该技术利用游戏引擎来定义和综合不同游戏状态的特定,高度控制的效果图,从而提高了对比性学习表现。我们在Carla驱动模拟器环境的图像上测试了GAMECLR对比度学习技术,并将其与流行的SIMCLR基线SSL方法进行比较。我们的结果表明,与基线相比,GAMECLR可以更准确地从游戏录像中推断游戏的状态信息。引入的方法使我们能够通过直接利用屏幕像素作为输入来进行游戏人工智能研究。
translated by 谷歌翻译
归一化是任何机器学习任务的重要过程,因为它控制数据的属性并影响了整个模型性能。然而,迄今为止,特定形式的正常化形式的影响已在有限的特定领域分类任务中,而不是以一般方式进行了研究。由于缺乏这样的全面研究的激励,我们在本文中调查了LP受限的软性损失分类器在不同的规范订单,幅度和数据维度上的性能在概念证明分类问题和现实世界中流行图像分类中的性能任务。实验结果总共表明,LP受限的软磁损耗分类器不仅可以实现更准确的分类结果,而且同时似乎不太容易过度拟合。在测试的三个流行深度学习体系结构和八个数据集中,核心发现持续存在,并建议LP归一化是在性能和​​收敛性方面的图像分类的推荐数据表示实践,并且反对过度拟合。
translated by 谷歌翻译
自我监督学习(SSL)技术已被广泛用于从高维复杂数据中学习紧凑而有益的表示。在许多计算机视觉任务(例如图像分类)中,此类方法获得了超过监督学习方法的最新结果。在本文中,我们研究是否可以利用SSL方法来学习游戏的准确状态表示的任务,如果是的,则在多大程度上。为此,我们从三个不同的3D游戏中收集游戏镜头和游戏内部状态的相应序列:Vizdoom,Carla Racing Simulator和Google Research Football Eniversion。我们仅使用原始帧训练图像编码器,使用三种广泛使用的SSL算法训练图像编码器,然后尝试从学习的表示形式中恢复内部状态变量。与预训练的基线模型(例如ImageNet)相比,我们在所有三场游戏中的结果都显示了SSL表示与游戏内部状态之间的相关性明显更高。这样的发现表明,基于SSL的视觉编码器可以产生一般的一般 - 不是针对特定任务量身定制的 - 但仅从游戏像素信息中提供了信息丰富的游戏表示。这样的表示反过来可以构成增强游戏中下游学习任务的性能,包括游戏玩法,内容生成和玩家建模。
translated by 谷歌翻译
深度强化学习中的一个开放研究问题是如何将稀疏领域中关键决策的政策学习重点。本文强调将“隐藏的马尔可夫模型”和“强化学习”的优势结合在一起,以朝着可解释的维护决策中。我们提出了一种新型的层次建模方法,该方法在高水平上检测并解释了失败的根本原因以及涡轮扇叶引擎的健康降解,而在低水平上,它提供了最佳的替换政策。它的表现优于直接应用于原始数据或使用隐藏的马尔可夫模型而没有这样的专业层次结构时,深入强化学习方法的基线性能。但是,它还提供了与先前的工作相当的绩效,并具有可解释性的额外好处。
translated by 谷歌翻译
一个适合监视fr \'echet均值概念和变形模型概念的概念的框架。通用的含义是使用fr \'echet平均报价的概念来捕获数据的典型功能形状,而变形模型的概念允许对配置文件与典型形状的偏差进行可解释的参数化。基于功能数据的形状特征构建和提出了功能性EWMA型控制图,允许(a)识别与控制内部行为的转变,以及(b)提供潜在转移的因果关系,并具有某些定性特征的显着偏差(例如振幅或相变)。实施功能监测方案以评估环境空气污染。特别是,该方法实施到合成数据示例,以评估其在各种条件下的性能,并使用来自雅典市地区的传感器数据进行真实世界的示例,在该地区,空气污染物的概况及其特征成功地分析了,并且确定了控制外行为。
translated by 谷歌翻译
View-dependent effects such as reflections pose a substantial challenge for image-based and neural rendering algorithms. Above all, curved reflectors are particularly hard, as they lead to highly non-linear reflection flows as the camera moves. We introduce a new point-based representation to compute Neural Point Catacaustics allowing novel-view synthesis of scenes with curved reflectors, from a set of casually-captured input photos. At the core of our method is a neural warp field that models catacaustic trajectories of reflections, so complex specular effects can be rendered using efficient point splatting in conjunction with a neural renderer. One of our key contributions is the explicit representation of reflections with a reflection point cloud which is displaced by the neural warp field, and a primary point cloud which is optimized to represent the rest of the scene. After a short manual annotation step, our approach allows interactive high-quality renderings of novel views with accurate reflection flow. Additionally, the explicit representation of reflection flow supports several forms of scene manipulation in captured scenes, such as reflection editing, cloning of specular objects, reflection tracking across views, and comfortable stereo viewing. We provide the source code and other supplemental material on https://repo-sam.inria.fr/ fungraph/neural_catacaustics/
translated by 谷歌翻译
While the brain connectivity network can inform the understanding and diagnosis of developmental dyslexia, its cause-effect relationships have not yet enough been examined. Employing electroencephalography signals and band-limited white noise stimulus at 4.8 Hz (prosodic-syllabic frequency), we measure the phase Granger causalities among channels to identify differences between dyslexic learners and controls, thereby proposing a method to calculate directional connectivity. As causal relationships run in both directions, we explore three scenarios, namely channels' activity as sources, as sinks, and in total. Our proposed method can be used for both classification and exploratory analysis. In all scenarios, we find confirmation of the established right-lateralized Theta sampling network anomaly, in line with the temporal sampling framework's assumption of oscillatory differences in the Theta and Gamma bands. Further, we show that this anomaly primarily occurs in the causal relationships of channels acting as sinks, where it is significantly more pronounced than when only total activity is observed. In the sink scenario, our classifier obtains 0.84 and 0.88 accuracy and 0.87 and 0.93 AUC for the Theta and Gamma bands, respectively.
translated by 谷歌翻译